过程挖掘可以根据企业信息系统生成的事件日志建立业务过程模型。当实际业务过程发生变化时,过程模型与事件日志之间会产生偏差,这时需要对过程模型进行修正。对于含有并行结构的过程模型修复,由于加入自环和不可见变迁等因素,有些现有的修正方法的精度会降低。因此提出一种基于逻辑Petri网和托肯重演的并行结构过程模型修复方法。首先根据子模型的输入输出库所与日志的关系,确定子模型的插入位置;然后通过托肯重演的方式确定偏差所在位置;最后根据基于逻辑Petri网提出的方法进行过程模型的修复。在ProM平台上进行了仿真实验,验证了该方法的正确性和有效性,并与Fahland等方法进行对比分析。结果表明,所提方法的精度达到85%左右,相比Fahland、Goldratt方法分别提高了17和11个百分点;在简洁度方面该算法没有增加自环和不可见变迁,而Fahland和Goldratt方法均增加了不可见变迁和自环;三种方法的拟合度均在0.9以上,而Goldratt方法略低一些。以上证明用所提方法修正后的模型具有更高的拟合度和精度。
股票市场是金融市场关键组成部分,因此对股票市场波动的研究对合理化控制金融市场风险、提高投资收益提供了重要支持,一直以来都是学术界和相关业界的关注焦点,然而,股票市场会受到各种因素的影响。面对股票市场中多源化、异构化的信息,如何高效挖掘、融合股票市场的多源异构数据具有挑战性。为了充分解释不同信息及信息间相互作用对于股票市场价格波动的影响,提出一种基于多重注意力机制的图神经网络来预测股票市场的价格波动。首先,引入关系维度构建股票市场交易数据和新闻文本的异构子图,并利用多重注意力机制实现图数据的融合;其次,通过图神经网络门控循环单元(GRU)进行图分类,在此基础上完成对股票市场中上证综合指数、沪深300指数、深证成份指数这三个重要指数波动的预测。实验结果表明,从异构信息特性角度,相较于股票市场交易数据,股市新闻信息对于股票价格影响存在滞后性;从异构信息融合角度,所提方法与支持向量机(SVM)、随机森林、多核k-means (MKKM)聚类等算法相比,预测准确率分别提升了17.88个百分点、30.00个百分点和38.00个百分点,并进行了模型交易策略的量化投资模拟。
MOOC平台上,一个课程可能存在多个版本的视频,为向学生推荐一个满足学习兴趣的MOOC视频就需要分析学生兴趣与视频内容的关系,为此,提出一种基于元路径注意力机制的视频推荐方法Mrec。一方面,利用异构信息网(HIN)描述学习者和MOOC资源之间的关系,进而使用元路径表达学生和视频之间的交互关系;另一方面,利用注意力机制捕捉学生、视频、元路径的特征对学习兴趣的影响情况。具体来说,Mrec方法包括两层注意力机制:第一层是节点注意力层,通过邻居的特征加权联合节点自身的特征,利用多头注意力得到实体在不同元路径下的特征表示;第二层是路径注意力层,通过融合在不同元路径的指导下学习到的实体的特征表示来捕捉实体在不同兴趣下的特征表示,并将学习到的用户与视频实体输入到多层感知机(MLP)中得到预测分数来进行top-K推荐。在MOOCCube和MOOCdata数据集上进行实验的结果表明,Mrec的点击率、归一化折损累积收益(NDCG)、平均倒数排名(MRR)与受试者工作特征曲线下面积(AUC)均优于对比方法。
针对支持向量机(SVM)、长短期记忆(LSTM)网络等智能算法在股市波动预测过程中股票评价特征选择困难及时序关系维度特征缺失的问题,为能够准确预测股票波动、有效防范金融市场风险,提出了一种基于改进遗传算法(IGA)和图神经网络(GNN)的股市波动预测方法——IGA-GNN。首先,利用相邻交易日间的时序关系构建股市交易指标图数据;其次,通过评价指标特性优化交叉、变异概率来改进遗传算法(GA),从而实现节点特征选择;然后,建立图数据的边与节点特征的权重矩阵;最后,运用GNN进行图数据节点的聚合与分类,实现了股市波动预测。在实验阶段,所研究的股票总评价指标数为130个,其中IGA在GNN方法下提取的有效评价指标87个,使指标数量降低了33.08%。应用所提IGA在智能算法中进行特征提取,得到的算法与未进行特征提取的智能算法相比,预测准确率整体提升了7.38个百分点;而与应用传统GA进行智能算法的特征提取相比,应用所提IGA进行智能算法的特征提取的总训练时间缩短了17.97%。其中,IGA-GNN方法的预测准确率最高,相较未进行特征提取的GNN方法的预测准确率整体提高了19.62个百分点;而该方法与用传统GA进行特征提取的GNN方法相比,训练时间平均缩短了15.97%。实验结果表明,所提方法可对股票特征进行有效提取,预测效果较好。
传统的股票预测方法大多基于时间序列模型,忽视了股票之间复杂的关系,并且该关系往往超出成对连接,例如同行业板块内股票或者基金持仓多支股票。针对该问题,提出一种基于时序超图卷积神经网络(HGCN)的股价走势预测方法,根据金融投资事实构造超图模型以拟合股票之间的多元关系,该模型包括两大组件:门控循环单元(GRU)网络和超图卷积神经网络。GRU网络对历史数据进行时间序列建模,捕捉长期依赖关系;HGCN建模股票间的高阶关系以学习内在关系属性,从而将股票间多元关系信息引入到传统的时序建模中,进行端到端的趋势预测。在中国A股市场真实数据集上的实验结果表明,相较于已有的股票预测方法,所提模型预测性能有所提升;如与GRU网络相比,所提模型在ACC和F1_score上的相对增幅分别为9.74%和8.13%,且更具有稳定性。此外,模拟回测结果显示,基于该模型的交易策略更具获利能力,年回报率达到11.30%,与长短期记忆(LSTM)网络相比提高了5个百分点。
共乘出行应用系统通过提高汽车可用座位容量利用率来减少交通拥堵、缓解停车位紧张,提高社会效益和环境效益。司机和乘客的实时匹配和优化技术是共乘系统的核心内容。基于角色的协同(RBC)是一种用于促进组织结构、提供有序系统行为和协调系统内活动的新方法。为了减少乘客和司机的动态实时匹配时间、提高匹配效率,提出结合RBC和环境-类、代理、角色、群组和对象(E-CARGO)模型形式化共乘问题的方法。在资源容量约束和利润收入给定的情况下,对共乘匹配问题进行建模和仿真实验,提高可用座位容量利用率,实现平台收益最大化,资源匹配合理化。实验结果表明,基于E-CARGO模型的形式化方法可以应用于共乘出行匹配问题建模,最优匹配矩阵和时间可以采用Kuhn-Munkres(K-M)算法和Java中的优化软件包(ILOG)解决方案获得。与ILOG软件包算法相比,K-M算法所用平均时间至少减少了21%;当代理规模大于一定数值(大于600)时,算法时间开销急剧增大。
针对已有的混合负载(HTAP)下物化视图异步增量维护任务生成算法主要面向多记录,无法面向单记录生成HTAP物化视图异步增量维护任务,导致磁盘IO开销的增加,进而降低HTAP物化视图异步增量维护性能的问题,提出面向单记录的HTAP物化视图异步增量维护任务的生成方法。首先,建立面向单记录的HTAP物化视图异步增量维护任务生成的效益模型;然后,基于Q-learning设计面向单记录的HTAP物化视图异步增量维护任务的生成算法。实验结果表明,所提算法在实现面向单记录生成HTAP物化视图异步增量维护任务的基础上,将平均每秒读写操作次数(IOPS)、平均CPU利用率(2核)和平均CPU利用率(4核)至少分别降低了8.49次、1.85个百分点和0.97个百分点。
预训练语言模型的发展极大地推动了机器阅读理解任务的进步。为了充分利用预训练语言模型中的浅层特征,并进一步提升问答模型预测答案的准确性,提出了一种基于BERT的三阶段式问答模型。首先,基于BERT设计了预回答、再回答及答案调整三个阶段;然后,在预回答阶段将BERT嵌入层的输入视作浅层特征来进行答案预生成;接着,在再回答阶段使用经BERT充分编码后的深层特征进行答案再生成;最后,在答案调整阶段结合前两个答案产生最终的预测结果。在抽取式问答任务的英文数据集SQuAD2.0和中文数据集CMRC2018上的实验结果显示,该模型在精准匹配度(EM)和F1分数(F1)两个指标上相较于同类基准模型平均提升了1~3个百分点,抽取出的答案片段更加准确。通过融合BERT中的浅层特征与深层特征,该三阶段模型拓展了BERT的抽象表示能力,探索了BERT中的浅层特征在问答模型中的应用,具有结构简单、预测准确、训练和推断速度快等特点。
利用人脸图片辅助诊断儿童阻塞性睡眠呼吸暂停(OSA)可以减轻医生的负担,提高诊断的准确率。首先,简要阐述了目前儿童OSA临床诊断中的方法及其局限性;然后,在研究了目前已有方法的基础上,结合计算机人脸辅助诊断其他疾病的方法,将计算机人脸辅助诊断儿童OSA的方法分为三种类型:传统的计算机人脸辅助诊断方法、基于迁移学习的诊断方法、基于3D人脸数据的诊断方法,综述了三种类型的方法中的关键步骤,并对这些关键步骤中使用的方法进行了对比研究,为将来儿童OSA计算机人脸辅助诊断的研究提供了不同的切入点;最后,分析了儿童OSA诊断未来研究中的机遇和挑战。
针对“中心云服务器+多个边缘服务器”构成的“云+边”混合环境中多任务卸载效率不足的问题,提出了一种基于概率性能感知演化博弈策略的任务卸载方法。首先,在一个“中心云服务器+多个边缘服务器”构成的“云+边”混合环境中,假设其中分布的边缘服务器具有时变波动的性能,采用一种基于概率性能感知演化博弈策略的任务卸载方法对边缘云服务器的历史性能数据进行概率分析,以获得演化博弈模型;然后,生成服务卸载的演化稳定策略(ESS),使每个用户都能在获得高满意度的前提下进行任务的卸载。基于云边缘资源位置数据集和云服务性能测试数据集进行模拟实验,在24个连续时间窗口上进行不同方法的测试比较。实验结果表明,所提方法在多个性能指标上都优于传统的贪婪(Greedy)算法、遗传算法(GA)和基于纳什均衡的博弈论算法等任务卸载方法。该方法的平均用户期望达成度相较于三个对比方法分别提升了13.7%、117.0%、13.8%,平均卸载时延分别降低了6.5%、24.9%、8.3%,平均货币成本分别降低了67.9%、88.7%、18.0%。
随着社交网络的发展,对其包含的海量文本进行情感分析具有重要的社会价值。不同于普通文本分类,短文本情感分类需要挖掘隐含的情感语义特征,具有极大的难度和挑战性。为了能在更高的层次上得到短文本的情感语义特征,提出了一种多头注意力记忆网络(MAMN)用于短文本情感分类。首先,利用n元语法特征信息和有序神经元长短时记忆(ON-LSTM)网络对多头自注意力机制进行改进,以对文本上下文内联关系进行充分提取,使模型可以获得更丰富的文本特征信息。然后,利用多头注意力机制对多跳记忆网络的结构进行优化,使得在拓展模型深度的同时,挖掘更高层次的上下文内联情感语义关系。在电影评论集(MR)、斯坦福情感树(SST)-1和SST-2这三个不同的数据集上进行了大量实验。实验结果表明,与基于循环神经网络(RNN)和卷积神经网络(CNN)结构的基线模型以及一些最新成果相比,所提MAMN取得了较优的分类效果,验证了多跳结构对于性能改善的重要作用。
针对智能电网相量测量设备竞争使用有限的网络通信资源时,会因资源分配不均而导致数据包延时或丢失,进而影响电力系统状态估计的精度这一问题,提出了一种采样感知加权循环(SAWRR)调度算法。首先根据电网相量测量单元(PMU)采样频率和数据包大小的特性,提出了基于PMU业务流均方差的权重定义方法;然后设计了相应的PMU采样感知迭代循环调度算法;最后将该算法运用到PMU采样传输模型中。该算法能自适应地感知PMU的采样变化,及时调整数据包的传输。仿真结果表明,与原始的加权循环调度算法相比,SAWRR算法减少了95%的PMU采样数据包的调度时延,降低了一半的丢包率,增加了两倍的吞吐量。将SAWRR算法运用到PMU数据传输中有利于保证智能电网的稳定性。